Model Selection

Regional-level visual understanding

# Regional-level visual understanding

ViP-LLaVA is an open-source multimodal chatbot, fine-tuned on LLaMA/Vicuna with image and region-level instruction data.

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase